Un algoritm creat de cercetătorii din Canada şi California a fost cel care a descoperit că în cazul de mai sus, rădăcina cuvintelor este „bituqen”. Programul poate reface rădăcinile cuvintelor moderne provenite din limbi dispărute, un proces care până acum era realizat „de mână”, pe baza regulilor ce explică cum tind să se schimbe sunetele lingvistice de-a lungul timpului.
Statisticianul Alexandre Bouchard-Côté de la Universitatea din Vancouver susţine că prin uşurarea procesului de reconstruire a limbilor ancestrale vor putea facilita modul de testare al ipotezelor legate de modul de formare al limbilor.
Nu este pentru prima dată când cercetătorii încearcă să realizeze reconstrucţia automată a limbilor, dar autorii noului algoritm susţin că proiectele anterioare erau greu de utilizat şi prescriptive.
Pentru a îmbunătăţi calitatea reconstrucţiei lingvistice, noul algoritm poate lua în calcul un număr mare de limbi şi reguli care privesc posibilele schimbări de sunet.
Programul necesită ca cercetătorii să adauge o listă de cuvinte din diferite limbi, înţelesul acestora şi arbore filogenetic prin care arată modul în care limbile sunt înrudite. În mod normal, lingviştii construiesc aceşti arbori folosind tehnici împrumutate din biologia evoluţionistă.
Arborii lingvistici
Algoritmul poate identifica automat cuvinte care au aceeaşi rădăcină. De exemplu cuvintele: noapte, night (în engleză), Nacht (germana), nacht (neerlandeză), nag (afrikaans), nicht (scoţiană), natt (suedeza, norvegiana), nic (ceha, poloneză), нощ, nosht (bulgară), ніч, nich (ucrainiană), nox (latină), noche (spaniolă), notte (italiană) provin din limba proto-indo-europeană.
Apoi, aplică reguli cunoscute pentru controlul schimbărilor de sunet pentru a deduce rădăcina probabilă a fiecărui set de cuvinte.
Până acum, cercetătorii au testat algoritmul pe 637 limbi austroneziene vorbite cu precădere în insulele din Asia de Sud-Est şi Pacific. În trecut, cercetătorii au folosit metode manuale pentru a reconstrui protolimba acestui grup despre care se crede că ar origina din Taiwan.
Echipa de cercetători coordonată de Bouchard-Côté au descoperit că predicţiile lor s-au potrivit cu cele oferite de metoda manuală în 85% din cazuri. „Sistemul nostru foloseşte doar un subset al factorilor luaţi în considerare de lingvişti, motiv pentru care credem că mare parte dintre discrepanţe reflectă îmbunătăţirile pe care va trebui să le facem”, recunoaşte Bouchard-Côté.
„Se pare că acest dispozitiv va putea fi utilizat pentru reducerea muncii . Totuşi metodele care dau rezultate corecte doar în 85% din cazuri nu sunt suficiente”, a declarat Don Ringe de la Universitatea din Pennsylvania.